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Hi 要 : 推荐 系统 偏差 的 研究 众多 但 零散 ， 相 关 研 究 综 述 较 少 ， 因 此 ， 根 据 偏 差 产 生 的 主体 将 偏差 分 为 用 户 行为 导 
致 的 偏差 、 物 品 展 示 导 致 的 偏差 和 推荐 算法 导致 的 偏差 ， 进 而 又 细 分 为 选择 偏差 、 一 致 性 偏差 等 九 种 具体 的 类 别 ， 
并 给 出 各 个 偏差 的 定义 和 造成 原因 ; 着 重 对 解决 偏差 问题 的 相关 性 推荐 方法 和 因果 性 推荐 方法 的 研究 进行 整理 ， 并 
根据 所 采用 技术 手段 或 者 所 处 训练 模型 的 前 、 中 、 后 三 个 阶段 进一步 分 类 ， 分 析 不 同类 别 研究 之 间 的 区 别 和 优势 ; 
总 结 了 在 常用 数据 集 上 的 偏差 研究 概况 和 新 提出 的 偏差 衡量 指标 ; 从 不 同 的 类 别 角度 对 面向 偏差 问题 的 推荐 方法 发 
展 趋势 进行 分 析 和 展望 ， 希 望 为 推荐 系统 中 的 后 续 的 偏差 研究 提供 一 定 的 帮助 。 

关键 词 : 推荐 系统 ; 偏差 ; 去 偏 ; 因果 性 ; 相关 性 

中 图 分 类 号 : TP391 doi: 10.19734/j.issn.1001-3695.2022.02.0092 


Review of recommendation methods for problem of bias 


Guo Nan, Huang Huihui? 
(School of Computer Science & Engineering, Northeastern University, Shenyang 110169, China) 


Abstract: Due to the numerous but scattered studies on the bias of recommendation systems and few relevant research reviews, 
according to the subject that causes the bias, this paper divides bias into the bias in user behavior, the bias in item display, and 
the bias in recommendation algorithm, and then subdivides it into nine specific categories, such as selection bias and 
conformity bias, and gives the definition and causes of each bias; This paper focuses on sorting out the research on correlation 
recommendation methods and causal recommendation methods to solve the bias problem, and further classifies them 
according to the technical means or the first, middle and last three stages of the training model, and analyzes the differences 
between different types of research; This paper summarizes common datasets and reviewers of bias studies and forecasts the 
development trend of bias-oriented recommendation methods from different categories, and hopes to provide some help for 
the follow-up bias research in recommender system. 

Key words: recommendation system; bias; debias; causality; correlation 


0 引言 户 的 偏好 更 难以 捕捉 。 最 后 就 是 推荐 算法 可 能 有 自己 本 身 的 
i 一 些 倾向 性 。 例 如 ， 基 于 流行 度 的 算法 倾向 于 推荐 较为 流行 
近年 来 ， 随 着 云 计算 、 大 数据 等 技术 的 迅猛 发 展 ， 互 联 ”的 物品 和 内 容 。 再 者 ， 推 荐 模型 是 一 个 从 反馈 数据 到 训练 模 
网 中 产生 的 信息 量 呈 爆炸 式 增 长 。 这 些 大 规模 的 数据 带 来 了 型， 再 到 利用 模型 给 用 户 产生 推荐 列表 ， 用 户 交 互 后 产生 反 
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PRAY “fa tek” WE. HE RSENS i 。 人 馈 数 据 往复 循环 的 过 程 ， 这 个 不 断 循环 的 过 程 也 会 进一步 加 
选 工具 应 运 而 生 ， 它 在 用 户 没有 明确 需求 的 情况 下 ， 能 够 担 ”大 各 种 偏差 。 推 荐 偏差 的 合理 解决 有 利于 更 为 准确 的 捕捉 用 
供 个 性 、 精 准 、 快 速 的 筛选 和 推送 ， 被 认为 是 缓解 信息 过 载 。 户 偏好 ， 但 当前 大 多 数 推荐 方法 研究 旨 在 发 明 一 些 机 器 学 习 
的 有 效 方法 。 如 今 ， 推 荐 技术 已 经 被 广泛 成 功 应 用 于 众多 领 = 模型 来 拟 合用 户 行 为 历史 数据 ， 而 忽略 由 于 用 户 行为 习惯 、 
RE, 如 电子 商务 平台 、 社交 网 络 、 视 频 分 享 平台 、 生活 应 用 等 。 物品 展示 方式 以 及 推荐 算法 本 身 的 设置 导致 观察 到 的 用 户 行 
虽然 推荐 系统 在 众多 领域 中 被 广泛 应 用 ， 但 是 其 面临 着 。 ”为 数据 存在 众多 偏差 的 问题 , 例如 选择 偏差 .站 曝光 偏差 中 、 
众多 偏差 问题 ， 偏 差 问 题 的 存在 可 能 会 使 得 本 文 无 法 精准 捕 。 位置 偏差 外 等 。 这 些 偏差 的 普遍 存在 使 得 直接 从 数据 中 学 习 


是 用 户 偏 好 ， 从 而 降低 推荐 的 有 效 性 。 例 如 ， 用 户 行为 数据 ”到 的 模型 无 法 完全 准确 的 表达 出 用 户 的 偏好 ， 降 低 了 推荐 效 
作为 推荐 模型 训练 的 基础 ， 是 观察 性 的 而 不 是 实验 性 的 。 推 ” 果 。 因 此 ， 如 何 去 除 这 些 偏差 对 模型 学 习 的 影响 ， 从 而 提升 
荐 系统 最 终 观 察 到 的 用 户 行为 历史 数据 是 各 种 复杂 因素 结合 。 推荐 系统 的 性 能 ， 逐 渐 引 起 了 广大 学 者 和 业界 的 关注 。 

碰撞 之 后 产生 的 结果 ,而 不 单纯 代表 用 户 对 物品 的 喜爱 程度 。 现 有 的 推荐 系统 偏差 研究 主要 可 以 分 为 相关 性 偏差 研究 


如 果 推 荐 算法 不 考虑 如 何 准确 的 “蒸馏 ”出 用 户 对 物品 的 偏 。 和 因果 性 偏差 研究 。 有 些 研究 致力 于 发 明 一 些 模型 来 拟 合用 
好 ， 可 能 会 导致 算法 无 法 准确 捕捉 用 户 的 偏好 ， 进 而 影响 推 ” 户 历史 数据 ， 单 纯 的 通过 匹配 数据 来 学 习 或 挖掘 相关 模式 ， 
荐 效果 。 除 了 用 户 行为 的 复杂 性 可 能 导致 的 偏差 ， 推 荐 系统 bp 有 研究 在 推荐 过 程 中 考虑 因果 关系 ， 能 在 观测 数据 之 外 思 
在 把 推荐 物品 展示 给 用 户 时 的 展示 方式 ， 包 括 但 不 限于 物品 。 考 用 户 建 模 和 个 性 化 推荐 钻 。 关 于 解决 推荐 系统 中 偏差 问题 
是 否 被 曝光 给 用 户 、 物 品 曝光 给 用 户 的 部 分 特征 ， 物 品 在 展 ” 的 研究 众多 但 零散 , 相关 的 研究 综述 也 很 少 口 。 因 此 , 本 文 着 
示 页 面 的 位 置 、 以 及 与 周围 其 他 物品 形成 的 对 比 情况 等 ， 这 对 近 几 年 解决 偏差 的 相关 研究 进行 整理 和 综述 ， 各 个 参考 
些 都 会 影响 用 户 与 物品 交互 的 概率 ， 混 淆 反馈 数据 ， 使 得 用 ”文献 来 源 情况 和 发 布 时 间 汇 总 如 图 1 所 示 。 不 同 于 推荐 系统 
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综述 [6,7]， 本 文 着 重 分 析 面 向 偏差 问题 的 推荐 方法 研究 ， 从 ”给 出 与 他 人 类 似 的 反馈 行为 ， 即 使 并 不 符合 自己 的 本 意 。 这 
相关 性 角度 和 因果 性 角度 对 研究 进行 了 分 类 阔 述 ， 分 析 不 同 。” 些 反馈 行为 产生 的 数据 并 不 总 是 可 以 精准 的 表达 出 用 户 的 真 


研究 之 间 的 区 别 和 优势 ， 并 对 面向 偏差 问题 的 推荐 方法 的 发 。” 实 偏好 。 文献 [13] 通 过 对 豆瓣 数据 集中 的 电影 评分 进行 分 析 ， 
展 趋势 进行 分 析 和 展望 。 证 明了 一 致 性 偏差 的 存在 。 文献 [14~17] 考 虑 通过 建 模 社会 因 
ones 素 对 用 户 行为 产生 的 影响 , 进而 引入 特定 参数 来 调节 一 致 性 偏差。 
ica P 2496. 12 ”物品 展示 导致 的 偏差 

ne 在 推荐 过 程 中 ， 由 于 物品 的 展示 方式 ， 包 括 但 不 限于 物 
Nm 品 是 否 被 曝光 给 用 户 、 物 品 曝光 给 用 户 的 部 分 特征 、 物 品 在 
5% 页 面 中 的 位 置 、 以 及 与 周围 其 他 物品 形成 的 对 比 情况 等 ， 这 
pcd WWW 些 都 会 影响 用 户 与 物品 的 交互 ， 混 消 反 馈 数 据 ， 使 得 不 容易 
17% 捕捉 用 户 真实 的 兴趣 偏好 。 物 品 展示 导致 的 偏差 主要 有 了 曝光 

Res WSDM 偏差 、 点 击 诱饵 、 位 置 偏差 和 上 下 文 偏 差 。 
曝光 偏差 曝光 偏差 是 由 于 物品 不 能 全 部 被 暴露 给 用 户 ， 
图 1 参考 文献 来 源 那些 没有 曝光 的 物品 没有 交互 信息 ， 但 没有 交互 信息 不 代表 
Fig. 1 Sources of references 是 负面 偏好 ， 因 此 存在 正 样本 未 标记 问题 ， 这 种 问题 常 存在 
s 于 隐 式 反馈 数据 中 。 某 个 用 户 -物品 对 没有 交互 信息 可 能 是 因 
1 ”推荐 系统 中 的 偏差 问题 为 用 户 不 喜欢 该 物品 或 者 并 未 检查 该 物品 ， 这 些 数据 无 法 明 
文献 [1] 对 推荐 系统 中 的 偏差 问题 进行 了 细致 的 总 结 与 。” 确 的 表达 用 户 偏好 ， 会 产生 歧义 。 影 响 物品 曝光 的 因素 有 很 
分 析 。 不 同 于 [1]， 本 文 根 据 产生 偏差 的 主体 来 划分 偏差 的 类 。 ”多 ， 例 如 先前 推荐 系统 的 偏差 、 用 户 的 地 理 位 置 以 及 物品 热 


物 
用 均匀 数据 和 负 样 本 


别 ， 并 丰富 和 完善 了 偏差 的 种 类 ， 根 据 偏差 产生 主体 的 不 同 度 的 影响 等 。 文 献 [3] 和 文献 [18] 分 别 逢 
划分 偏差 ， 从 主体 角度 划分 偏差 的 类 别 ， 有 利于 统一 去 除 同 。 采样 来 解决 曝光 偏差 问题 。 


一 个 主体 产生 的 备 种 偏差 ， 为 一 次 去 除 多 种 偏差 提供 思路 。 点 击 诱饵 点 击 诱饵 问题 常 存在 于 隐 式 反馈 数据 ， 指 的 
1.1 用 户 行为 导致 的 偏差 是 用 户 作出 点 击 行为 之 前 看 到 的 物品 曝光 特征 和 点 击 行为 之 


在 推荐 过 程 中 , 由 于 自身 的 行为 ,心理 以 及 当时 的 状态 ， 后 的 物品 内 容 特征 不 相符 。 例 如 ， 有 些 物品 的 点 击 率 虽 高 ， 
用 户 可 以 自由 选择 对 哪些 物品 进行 浏览 检查 、 点 击 和 评分 ， 但 用 户 满意 度 却 很 低 ， 这 些 物品 有 可 能 标题 和 内 容 不 相符 或 
也 可 能 受到 从 众 心理 、 社 交 圈 朋友 或 偶像 的 影响 ， 从 而 作出 ”者 物品 内 容 质量 太 差 ,从 而 损害 了 用 户 满意 度 , 对 这 些 物品 ， 

一 些 不 符合 自己 偏好 的 反馈 行为 ， 因 此 这 些 反 馈 数据 并 不 能 。” ”推荐 系统 应 该 致力 于 提升 用 户 满意 度 而 不 是 用 户 点 击 率 。 为 
真实 的 表达 出 用 户 真实 的 偏好 ， 如 果 单 纯 的 使 用 这 些 反馈 妆 了 缓解 点 击 诱饵 问题 ， 很 多 研究 试图 在 推荐 算法 中 加 入 更 多 
据 进行 模型 训练 和 下 一 次 推荐 结果 的 生成 ， 会 一 定 程度 上 降低 。 ”的 信息 ， 如 停留 时 间 、 物 品 特征 和 各 种 用 户 反 馈 ， 来 缩小 点 
推荐 效果 。 用户 行 为 导致 的 偏差 主要 有 选择 偏差 和 一 致 性 偏差 。 ” 击 和 喜欢 之 间 的 差距 U9。 文献 [20~22] 首 先 根据 这 些 信息 识别 
选择 偏差 选择 偏差 发 生 在 用 户 评分 阶段 ， 因 此 常 存 在 ”出 虚假 点 击 互动 ， 然 后 仅 使 用 正面 互动 去 训练 模型 ， 文 献 


于 显 式 反馈 数据 中 ， 由 于 用 户 可 以 自由 的 选择 对 哪些 物品 进 ” [23~27] 合 并 额外 的 点 击 后 反馈 数据 (如 收藏 ) 来 优化 推荐 模型 。 
行 评分 ， 因 此 最 终 观 察 到 的 评分 并 不 是 所 有 评分 的 代表 性 样 位 置 偏差 和 上 下 文 偏差 位 置 偏差 主要 存在 于 搜索 引擎 
Ak. 文献 [2] 通 过 让 用 户 根据 自己 对 歌曲 的 喜爱 程度 来 估计 或 者 广告 系统 中 ， 当 用 户 倾向 于 与 列表 中 较 高 位 置 的 物品 进 
身 对 歌曲 的 评价 频率 ,证 明了 选择 偏差 的 存在 。 文 献 [1] 也 表 ” 行 交互 而 不 考虑 实际 相关 性 时 ， 物 品 展示 的 位 置 影响 用 户 与 


明 ， 用 户 更 倾向 于 选择 和 评价 自己 喜欢 的 物品 ， 更 有 可 能 对 ”物品 交互 的 概率 ,会 干扰 算法 对 用 户 偏好 的 捕 提 。 文 献 [4] 进 

村 别 差 或 特别 好 的 物品 评分 。 文 献 [8~11] 均 提出 无 偏 估计 量 。 行 了 一 项 眼球 跟踪 的 综合 研究 ， 印 证 了 搜索 引擎 中 位 置 偏 差 

来 缓解 选择 偏差 问题 。 的 存在 。 上 下 文 偏差 则 是 指 用 户 和 物品 交互 的 时 候 会 被 其 周 

一 致 性 偏差 披露 先前 的 集体 评分 会 扭曲 个 人 的 决策 以 围 物 品 所 影响 ， 随 着 用 户 浏 览 深 度 的 加 大 ， 上 下 文 偏差 的 影 

及 个 人 对 质量 和 价值 的 看 法 ， 评 级 系统 不 是 简单 地 汇总 个 人 ” 响 逐 渐 超 过 位 置 偏差 ， 两 者 均 常 存在 于 隐 式 反馈 数据 中 。 文 

意见 ， 而 是 创造 一 个 以 系统 方式 影响 后 续 评 级 的 环境 04。 — ” 献 [28,29] 均 采用 IPS 技术 缓解 上 下 文 偏差 。 对 各 种 偏差 的 总 
致 性 偏差 就 是 指 是 用 户 受到 大 众 或 者 朋友 的 影响 ， 会 倾向 于 AWK 1 所 示 。 

表 1 九 种 偏差 及 其 相关 文献 

Tab.1 Nine bias and related literature 


主体 偏差 类 型 ”反馈 类 型 造成 原因 主要 解决 方案 相关 文献 
选择 偏差 显 式 观察 到 的 评分 不 是 所 有 评分 的 代表 性 样本 多 匀 数 据 、 道 倾向 分 数 、 元 学 习 [3,8~11,39,47,48,58,66,77~79,85] 
户 一 致 性 偏 . 
Q0 8S Bast 户 会 受到 大 众 和 其 他 人 的 影响 生成 性 建 模 、 逆 倾向 分 数 [13~17,80] 
曝光 偏差 AR E 荐 结果 中 只 能 有 一 部 分 物品 曝光 给 用 户 均匀 数据 、 逆 倾向 分 数 、 采 样 [3,18,41,70,72,74] 
7 物品 在 用 户 点 击 之 前 暴露 的 特征 和 点 击 之 后 的 内 容 特征 采样 、 因 果 图 、 
点 击 诱饵 隐 式 [19~27] 
ne 不 相符 利用 额外 反馈 信息 
”位 置 偏差 BR 各 个 物品 展示 给 用 户 时 位 置 不 同 生成 性 建 模 、 逆 倾向 分 数 [28,51,65,67,68,75,76,85] 
上 下 文 偏 物品 展示 给 用 户 时 ， 和 周围 物品 形成 的 
隐 式 生产 性 建 模 、 倾 向 分 数 [28,29,49,68] 
差 对 比 
循环 偏差 显 式 、 隐 式 荐 过 程 的 循环 过 程 使 得 各 种 偏差 被 放大 均匀 数据 、 样 本 加 权 、 强 化 学 习 、 因 果 图 [38,42,56,83] 
人 气 偏 差 显 式 、 隐 式 热门 的 物品 被 过 度 推荐 正则 化 、 生 成 性 建 模 、 强 化 学 习 、 评 估 器 、 重 排序 [31~33,43,44,50,57,69,81,82] 
算法 正则 化 、 对 抗 学 习 、 强 化 学 习 、 自 动 编码 器 、 重 排 
不 公平 EA KR 算法 歧视 某 些 群 体 或 者 个 人 序 、 [34,35,45,46,52~54,59,61~63,84] 


生成 性 建 模 
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注 : 其 中 文献 [3] 同 时 解决 了 选择 偏差 和 曝光 偏差 ， 文 献 i 
[40] 同 时 解决 了 选择 偏差 、 一 致 性 偏差 、 曝 光 偏 差 、 位 置 偏差 ， 2 ”基于 相关 性 去 信 

文献 [68] 同 时 解决 了 位 置 偏 差 和 上 下 文 偏差 , 文献 [85] 同 时 解 相关 性 研究 致力 于 发 明 一 些 模 型 来 拟 合用 户 历史 数据 ， 
决 了 选择 偏差 和 位 置 偏 差 , 男 外 文献 [55,60,71,73] 并 未 划分 仿 单纯 的 通过 匹配 数据 来 学 习 或 挖掘 相关 模式 。 但 随 着 推荐 算 


差 类 别 ， 以 实现 无 偏 推荐 为 目的 ， 不 具体 针对 某 种 具体 类 型 ” 法 研究 的 不 断 丰 富 ， 推 荐 结果 的 精确 性 和 准确 性 不 再 是 算法 
偏差 。 单纯 追求 的 目标 ， 有 研究 人 员 注 意 到 ， 仅 仅 基于 相关 性 或 关 
1.3 推荐 算法 导致 的 偏差 联 性 无 法 很 好 的 评估 和 解决 公平 性 问题 B9。 任 何 相关 性 的 背 


不 同 的 推荐 算法 本 身 也 带 有 一 定 的 倾向 ， 比 如 基于 流行 ”后 都 隐藏 着 因果 关系 ， 相 关 性 分 析 得 到 的 结论 有 时 是 不 可 靠 
度 的 算法 倾向 于 推荐 较为 流行 的 物品 或 内 容 ， 而 基于 协同 过 ”的 甚至 是 错误 的 ， 且 基于 相关 性 的 方法 不 能 用 于 管理 、 控 制 
滤 的 算法 则 一 般 对 交互 比较 多 的 用 户 或 物品 的 推荐 更 友好 些 。 和 干预 变量 或 事件 S14。 因 此 基于 因果 性 来 缓解 偏差 的 研究 被 
E 荐 算法 导致 的 偏差 主要 有 人 气 偏差 、 不 公平 问题 和 循环 偏差 。 提出。 因果 性 研究 在 推荐 过 程 中 考虑 因果 关系 ， 能 在 观测 数 

不 公平 推荐 中 的 不 公平 指 的 是 ， 系 统 不 公平 的 歧视 某 ”” 据 之 外 思考 用 户 建 模 和 个 性 化 推荐 外 。 本 文 将 偏差 相关 文献 
些 个 人 和 群体 ， 偏 祖 他 人 。 例 如 ， 与 男性 相 比 ， 女 性 看 到 高 。 分 为 相关 性 去 偏 研究 和 因果 性 去 偏 研究 。 
薪 工 作 的 广告 较 少 。 文 献 [34] 等 就 将 此 问题 映射 为 一 个 有 限 在 相关 性 的 去 偏 的 研究 中 ， 根 据 文献 采用 的 技术 以 及 作 
的 问题 : 公平 的 分 配 不 可 分 割 的 物品 ， 提 出 的 FairRec 算法 用 的 阶段 不 同 进行 了 分 类 和 汇总 ， 如 图 2 所 示 。 其 中 ， 均 勾 
不 仅 保证 了 大 多 数 商品 提供 商 的 利益 ， 也 为 每 位 用 户 提供 了 数据 和 采样 属于 前 处 理 操作 ， 在 训练 模型 前 就 通过 小 部 分 无 
较 高 的 满意 度 , 相似 的 还 有 文献 [35], 使 用 贪心 算法 来 寻找 公 有 的 数据 或 采样 手段 来 解决 偏差 问题 ， 而 样本 加 权 、 正 则 化 
平 的 TOP-N 列表 解决 组 推荐 中 的 公平 性 问题 。 和 训练 模型 则 是 作用 于 训练 阶段 ， 目 的 是 训练 出 无 偏 的 模型 
循环 偏差 循环 偏差 的 存在 是 由 于 推荐 系统 是 一 个 从 反 ”来 产生 无 偏 的 推荐 结果 。 训 练 模型 根据 采用 的 技术 不 同 又 细 
馈 数 据 训练 模型 ， 再 到 利用 模型 给 用 户 产 生 推荐 列表 ， 用 户 。” 分 为 生成 性 建 模 、 强 化 学 习 、 元 学 习 、 自 动 编码 器 和 对 抗 学 


=> 


交互 后 产生 反馈 数据 往复 循环 的 过 程 ， 在 这 个 不 断 循环 的 过 习 ， 评 估 器 和 重 排序 则 是 属于 后 处 理 ， 旨 在 通过 无 偏 的 推荐 
程 中 上 述 的 各 种 偏差 会 进一步 被 加 深 。 指标 和 推荐 列表 的 重新 排序 来 缓解 偏差 问题 。 
| 


训练 过 程 


图 2 相关 性 去 偏方 法 
Fig.2 Debias method of correlation 
2.1 均匀 数据 和 采样 倾向 分 数 就 可 以 用 作 样 本 加 权 。 逆 倾向 分 数 是 一 种 反 事实 技 
均匀 数据 可 以 缓解 模型 的 偏差 问题 。 对 于 用 户 的 请 求 ， 术 , 可 以 利用 这 种 思想 重新 加 权 收 集 的 数据 进行 无 偏 的 学 习 。 
系统 不 再 使 用 推荐 模型 生成 推荐 列表 ， 而 是 从 所 有 候选 物品 。 但 是 这 种 方法 依赖 于 倾向 分 数 的 准确 性 ， 通 常会 有 方差 较 高 
中 ， 随 机 选择 某 些 物品 进行 推荐 。 均 匀 数 据 可 以 无 偏差 的 反 ”的 缺点 , 所 以 也 衍生 出 了 很 多 改进 方法 。 文献 [42] 提 出 用 影响 

映 用 户 的 偏好 ， 也 不 受 先前 模型 的 影响 ， 但 是 由 于 均匀 数据 ”函数 重新 加 权 培 训 样 本 ,更 好 的 解决 了 循环 偏差 问题 。 
的 收集 会 损害 用 户 的 体验 ， 所 以 如 何 有 效 的 利用 均匀 数据 就 正则 化 也 可 以 用 来 减少 推荐 模型 的 偏差 [1]。 为 了 解决 人 
显得 十 分 重要 。 文 献 [38] 通 过 均匀 数据 的 反 事 实 建 模 来 缓解 。 气 偏差 问题 , 文献 [43] 提 出 基于 正则 化 的 处 理 方法 , 通过 降低 
循环 偏差 问题 ， 为 了 更 有 效 地 使 用 少数 有 价值 的 均匀 数据 ， 物品 流行 度 和 模型 预测 分 数 之 间 的 关联 程度 来 最 小 化 偏差 ， 


f 
提出 了 一 个 用 于 反 事 实 推荐 的 通用 知识 蒸馏 框架 ， 来 实现 均 ”预测 分 数 和 物品 流行 度 之 间 的 皮尔 逊 相关 系数 作为 正则 化 项 。 
匀 数 据 的 建 模 ， 从 而 解决 了 循环 偏差 问题 ， 不 同 的 是 ,文献 ”文献 [44] 也 将 正则 化 作为 一 种 辅助 手段 根据 人 气 值 惩罚 物品 
[39] 则 利用 均匀 数据 解决 了 选择 偏差 。 也 有 其 他 研究 将 均匀 ”的 预测 得 分 ， 来 缓解 人 气 偏差 问题 。 也 有 学 者 将 正则 化 用 作 
数据 当 作 一 种 辅助 手段 来 解决 偏差 问题 。 文 献 [40] 通 过 均匀 。” ”解决 不 公平 性 问题 。 文 献 [45] 利 用 一 个 基于 KL 散 度 的 正则 
数据 来 监督 框架 参数 的 学 习 ， 最 大 化 均匀 数据 的 损失 来 优化 ”化 项 , 旨 在 对 每 个 用 户 的 分 数 进行 归 一 化 , 文献 [46] 则 利用 正 
框架 的 去 偏 参 数 ， 而 文献 [3] 则 是 组 合 了 均匀 数据 (Uniform ” 交 正 则 化 使 得 无 偏差 的 用 户 嵌 入 正 交 于 偏差 感知 的 用 户 典 入 ， 


data)、 逆 倾向 分 数 和 数据 填充 (Dataimputation) 来 同时 解决 曝 以 便 更 好 的 区 分 两 者 。 
光 偏差 和 位 置 偏差 。 2.3 训练 模型 
采样 策略 可 以 控制 哪些 数据 用 来 更 新 模型 ， 从 而 纠正 数 偏差 问题 也 可 以 通过 训练 无 偏 的 推荐 模型 来 解决 ， 直 接 


据 的 分 布 。 文 献 [18] 利 用 用 户 浏览 但 是 未 点 击 的 数据 通过 负 ”使 用 无 偏 的 推荐 模型 产生 的 推荐 结果 就 是 无 偏 的 。 无 偏 模型 
样本 采样 技术 来 解决 曝光 偏差 问题 ， 通 过 对 抗 训练 来 生成 高 。 的 训练 可 以 选用 很 多 技术 ， 根 据 各 个 研究 采用 技术 的 不 同 ， 
质量 的 负 样 本 ,与 之 类 似 , 文献 [41] 则 是 在 构建 的 基于 物品 的 ”本 文 将 这 些 研究 细 分 为 生成 性 建 模 、 强 化 学 习 、 元 学 习 、 自 


知识 图 谱 上 进行 采样 来 缓解 曝光 偏差 。 动 编码 器 和 对 抗 学 习 等 不 同 的 类 别 。 
2.2 样本 加 权 和 正则 化 2.3.1 生成 性 建 模 


样本 加 权 是 指 在 模型 训练 时 修正 每 组 样本 的 损失 贡献 值 ， 生成 性 建 模 来 解决 偏差 问题 的 主要 思想 是 假设 反馈 数 
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的 生成 过 程 并 相应 减少 偏差 Cj。 该 类 研究 假设 数据 的 生成 过 方案 。 

程 ， 有 利于 定位 各 个 偏差 ， 被 广泛 应 用 于 解决 各 种 偏差 。 图 2.3.3 自动 编码 器 
3 概括 了 点 击 数据 和 评分 数据 的 生成 过 程 。 文 献 [47,48] 通 过 也 有 研究 利用 自动 编码 器 来 处 理 推荐 系统 中 的 各 种 偏差 ， 
建 模 评分 的 生成 过 程 来 解决 选择 偏差 问题 。 前 者 通过 探索 物 自动 编码 嚣 框架 如 图 4 所 示 。 

品 的 可 观察 性 ， 用 户 选 择 和 评分 之 间 的 复杂 依赖 性 来 解决 
MNAR(Missing Not at Random) 问 题 ， 评 分 生成 过 程 为 观察 - 
选择 -评分 。 后 者 考虑 了 社交 网 络 , 通过 对 观察 过 程 和 评分 过 
程 的 建 模 ， 解 决 了 选择 偏差 问题 和 受 朋 友 推 荐 的 物品 会 给 出 
低 分 的 问题 ， 评 分 生成 过 程 为 观察 -评分 。 


4 自动 编码 器 框架 


Fig.4 Autoencoder frame 


Cee 文献 [59] 关 注 主流 偏差 ， 是 指 推荐 系统 倾向 于 向 具有 主 
流 品味 的 用 户 提供 更 好 的 推荐 结果 ， 而 忽略 非 主流 用 户 ， 在 

图 3 ”数据 生成 流程 学 习 用 户 和 物品 基于 文本 的 卷 积 神经 网 络 时 添加 自动 编码 器 

Fig.3 Data generation process 层 ， 强 制 要 求 所 有 用 户 和 物品 的 独特 特征 充分 整合 并 保存 在 

也 有 其 他 学 者 将 生产 性 建 模 的 思想 用 于 解决 其 他 偏差 问 。 学 习 到 的 表示 中 ， 使 得 学 习 的 表示 更 少 的 偏向 于 主流 用 户 ， 
题 。 文 献 [49] 就 提出 了 一 个 完全 数据 驱动 的 神经 模型 来 解决 。 缓解 了 主流 偏差 的 同时 又 保持 了 主流 用 户 的 推荐 质量 ， 最 终 


上 下 文 偏差 问题 ， 考 虑 点 击 特定 物品 和 同一 会 话 中 其 他 物品 ”给 所 有 用 户 提供 更 加 平衡 的 推荐 结果 。 自 动 编码 器 的 原始 输 
之 间 的 关联 ， 包 括 相关 性 和 位 置 ， 着 重 对 检查 过 程 建 模 。 文 入 是 用 户 评论 或 物品 属性 的 特征 表示 ， 用 来 重 构 用 户 和 物品 
献 [50] 则 把 人 气 偏差 问题 归 因 于 整个 推荐 循环 的 各 个 阶段 ， 的 原始 特征 向 量 。 文献 [60] 为 了 更 好 的 利用 大 量 未 观测 数据 ， 
而 不 单单 是 一 个 原因 造成 的 ， 提 出 了 一 种 动态 的 缓解 偏差 策 。 实现 自 适 应 的 权重 分 配 和 有 效 的 模型 学 习 ， 提 出 了 一 种 基于 
多， 对 整个 推荐 过 程 进行 建 模 。 文献 [51] 则 提出 了 一 个 增强 的 。”” 变 分 自动 编码 器 的 快速 自 适 应 加 权 和 矩阵 分 解 方案 对 数据 可 信 
六 置 偏 差 模 型 ， 明 确 模 拟 了 依赖 于 位 置 的 点 击 噪 声 ， 解 决 了 度 权重 进行 建 模 ， 减 少 推 凯 参数 数量 的 同时 ， 还 能 够 捕获 用 
天 用 户 信 任 排名 质量 而 导致 的 位 置 偏差 ， 着 重 对 检查 - 点 击 。 户 之 间 的 潜在 相互 作用 ,其 中 编码 器 是 用 来 编码 用 户 影响 力 ， 
过 程 建 模 ， 并 提出 了 补充 模型 来 建 模 用 户 感 知 相 关 性 和 实际 即 消 费 量 ， 解 码 器 用 来 预测 用 户 的 消费 ， 共 同 组 成 自动 编码 
相关 性 之 间 的 关系 。 文献 [52] 致 力 于 解决 新 物品 推荐 公平 性 ， ”器 来 学 习 和 矩阵 分 解 的 数据 置信 和 度 权重 和 潜在 因素 。 

在 证 明了 数据 偏差 可 以 通过 物品 内 容 特征 从 热 启 动物 品 转移 2.3.4 对 抗 学 习 


到 新 物品 之 后 ， 提 出 联合 学 习 生 成 模型 来 解决 冷 启动 阶段 的 现 有 研究 常 使 用 对 抗 学 习 来 解决 推荐 系统 中 的 不 公平 问 
不 公平 问题 ， 模 型 不 断 调整 物品 匹配 用 户 分 数 分 布 状况 ， 弥 ” 题 ， 对 抗 式 学 习 框 架 如 图 5 所 示 。 文 献 [61] 提 出 一 种 基于 图 
补 分 数 分 布 较 低 的 物品 ， 从 而 缓解 不 公平 问题 。 不 同 的 是 ， 的 解决 方案 ， 给 定 任何 模型 的 原始 铅 入 ， 学 习 一 组 过 滤器 ， 
文献 [53] 为 了 解决 在 推荐 职业 相关 敏感 物品 时 的 性 别 偏差 ， 将 用 户 和 物品 的 原始 嵌入 转换 到 基于 敏感 特征 集 的 过 滤 嵌 入 
提出 使 用 神经 协同 过 滤 的 预 训 练 和 微调 方法 ， 加 以 偏差 纠正 则 中 。 对 于 每 个 用 户 ， 这 种 转换 是 在 以 用 户 为 中 心 的 图 的 

子 


技术 开发 了 一 种 框架 ， 更 细致 化 的 解决 了 推荐 系统 中 的 不 公 


抗 学 习 下 实现 的 ， 以 便 混 淆 过 滤 后 的 用 户 嵌 入 和 该 用 户 
结构 之 间 的 敏感 特征 。 过 滤 后 的 岁入 不 仅 能 表示 用 户 偏好 
同时 还 必须 是 公平 的 ， 不 会 泄露 用 户 的 敏感 信息 。 采 用 对 
学 习 技 术 训练 模型 ， 过 滤 网 络 扮演 生成 器 的 角色 试图 掩盖 
户 的 敏感 信息 ， 而 鉴别 器 网 络 将 过 滤 后 的 嵌入 作为 输入 ， 
图 预测 敏感 属性 的 值 ， 两 个 网 络 进行 极 小 极 大 博弈 。 


2.3.2 强化 学 习 和 元 学 习 

众多 学 者 利用 强化 学 习 来 解决 各 种 偏差 问题 。 文 献 [54] 
认为 应 该 考虑 长 期 的 公平 性 ， 随 着 时 间 的 发 展 ， 受 公平 性 保 
护 的 物品 组 不 应 该 是 固定 的 。 该 研究 关注 不 同 物品 组 的 曝光 
公平 性 ， 提 出 一 种 公平 性 约束 的 强化 学 习 推 荐 算法 ， 将 推荐 
问题 建 模 为 一 个 约束 马尔 可 夫 决 策 过 程 ， 能 够 动态 调整 推荐 
策略 ， 确 保 环 境 发 生 改 变 时 ， 也 能 满足 公平 性 的 要 求 。 文 献 
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[55] 利 用 强化 学 习 在 模拟 用 户 行为 之 前 纠正 记录 数据 中 的 仿 

差 ， 实现 了 无 偏 的 推荐 。 文 献 [56,57] 通 过 强化 学 习 分 别 来 解 图 5 对抗 式 学 习 框 架 

决 循环 偏差 和 和 人气 偏 差 ， 前 者 利用 了 反 事 实 的 技术 ， 后 者 利 Fig.5 Adversarial learning framework 

用 多 臂 老 虎 机 来 多 样 化 用 户 偏好 。 文献 [45] 通 过 一 个 去 偏 化 的 个 性 化 排名 模型 展示 了 如 何 


元 学 习 的 思想 是 如 果 模 型 能 先 在 数据 较 多 的 数据 集 上 学 ”基于 统计 均等 和 机 会 均等 来 克服 不 公平 问题 ， 其 中 采用 对 抗 
习 ， 学 习 到 一 些 先 验 知识 后 再 去 在 数据 较 少 的 数据 集 上 学 习 学 习 来 增强 物品 组 之 间 分 数 分 布 的 相似 性 ， 在 BPR(Bayesian 
就 变 得 容易 。 文 献 [58] 为 了 解决 逆 倾 向 分 数 会 遭受 较 大 方差 Personalized Ranking) 模 型 和 鉴别 器 之 间 进 行 极 大 极 小 博弈 ， 
的 问题 ， 利 用 元 学 习 缓 解 选择 偏差。 首先 使 用 观察 到 的 评分 。 BPR 模型 扮演 生成 器 需要 防止 鉴别 器 对 物品 组 进行 正确 分 
数据 预 训练 三 个 推荐 算法 ， 然 后 使 用 其 中 两 个 算法 对 随机 抽 K, 鉴别 器 则 是 根据 BPR 预测 的 用 户 物 品 得 分 对 物品 组 进行 
取 的 一 系列 用 户 - 物 品 对 进行 预测 评分 , 如 果 两 个 模型 结果 足 。” 分 类 ,文献 [46] 则 是 将 用 户 兴 趣 分 解 为 两 个 部 分 , 一 个 组 件 用 
够 相似 ， 便 使 用 两 个 结果 之 一 作为 这 一 数据 对 的 伪 评 分 ， 这 于 学 习 一 种 感知 偏差 的 用 户 嵌 入 来 捕获 敏感 用 户 属性 上 的 1 
样 可 以 得 到 一 个 可 以 信赖 的 伪 标 签 数据 集 ， 最 后 在 伪 标 签 数 差 信 息 ， 另 一 个 组 件 用 于 学 习 无 偏差 的 用 户 典 入 仅 捕 获 用 户 
据 集 上 去 训练 第 三 个 模型 , 由 这 个 模型 给 出 最 终 的 推荐 结果 。 ”兴趣 信息 ， 无 偏差 的 用 户 伦 入 则 采用 了 对 抗 学 习 来 训练 ， 学 
文献 [40] 也 提出 了 基于 元 学 习 的 参数 学 习 方法 ， 通 过 最 小 化 ”” 习 无 偏差 用 户 和 能 入 的 模型 扮演 生成 器 角色 ， 属 性 鉴别 器 则 用 
风险 化 差异 来 统一 处 理 各 种 偏差 ， 实 现 了 自 适 应 的 偏差 解决 ” ”来 从 无 偏差 用 户 嵌 入 中 推断 用 户 属 性 , 两 者 形成 对 抗 。 最 后 ， 
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为 了 实现 公平 的 新 闻 排 名 系统 ， 只 使 用 无 偏差 用 户 杠 入 来 产 。” 论 的 过 程 的 。 基 于 因果 推断 的 相关 研究 大 多 是 在 干预 和 反 事 
生 推 荐 结果 。 实 的 基础 上 定义 的 ,干预 可 通过 随机 实验 来 实现 ， 而 反 事实 
2.4 ”评估 器 和 重 排 序 则 考虑 现实 世界 之 外 的 假设 世界 。 当 前 主流 研究 主要 是 利用 
利用 评估 器 去 除 偏差 的 主要 思想 是 通过 修正 评估 度量 来 忆 果 推断 中 的 逆 倾 向 分 数 和 因果 图 来 缓解 推荐 系统 中 的 偏差 。 


实现 无 偏 的 推荐 ， 修 正 评估 度量 的 研究 主要 利用 逆 倾 向 分 数 3.1 基于 IPS 技术 的 因果 性 去 偏 
技术 来 实现 。 也 有 相关 学 者 提出 新 的 指标 来 衡量 人 气 偏差 。 IPS 属于 因果 推断 中 的 一 种 技术 ， 可 以 调节 原始 数据 的 
文献 [31] 提 出 了 校准 的 概念 来 衡量 用 户 历 史 物 品 的 人 气 分 布 。 分 布 。 该 方法 通过 重新 加 权 样 本 将 观察 到 的 记录 数据 转换 为 
和 推荐 物品 之 间 的 匹配 度 ， 从 不 同 利益 相关 者 角度 衡量 时 ， 伪 随 机 实验 ， 一 般 来 说 ， 首 先 估计 倾向 分 数 ， 然 后 用 倾向 分 
该 度量 能 更 好 的 反映 算法 的 性 能 。 之 后 的 研究 [32] 又 从 用 户 0 数 的 倒数 重新 加 权 样 本 ， 倾 向 分 数 可 以 看 做 是 某 种 事件 发 生 
角度 出 发 ,提出 了 一 个 可 以 衡量 人 气 偏差 的 新 指标 UPD(User HIRR, IPS 已 被 广泛 用 于 无 偏 评 估 和 学 习 [65]。 利 用 IPS 消 
Popularity Deviation). 除 偏差 的 研究 可 以 分 为 两 类 ， 评 估 器 和 模型 训练 。 评 估 器 主 
重 排 序 是 一 种 可 以 应 用 于 任何 推荐 算法 输出 的 后 处 理 上 要 是 利用 倾向 分 数 的 思想 来 纠正 评价 指标 ， 而 利用 IPS 的 模 
JE. 是 以 先前 推荐 模型 输出 的 TOP-N 列表 为 基础 进行 的 ， 型 训练 主要 是 利用 倾向 分 数 的 思想 融合 到 训练 过 程 ， 进 而 实 
排序 的 任务 就 是 生成 一 个 新 的 重新 排序 的 TOP-K 列表 , 其 中 现 无 偏 推荐 。 
(Kz<N) ， 该 列表 在 保证 一 定 准 确 性 的 同时 也 考虑 了 偏差 问题 。 IPS 思想 也 可 以 融合 到 模型 训练 中 实现 无 偏 推荐 。 文 献 
文献 [33] 为 了 缓解 人 气 偏差 .引入 了 个 性 化 的 重新 排名 方法 ， [71] 为 推荐 的 因果 效应 提出 了 一 个 无 偏 的 学 习 框 架 ， 首 先 构 
来 增加 推荐 列表 中 不 太 受 欢迎 的 物品 数量 ， 同 时 保持 可 接受 建 用 于 排名 度量 的 无 偏 估计 ， 然 后 对 估计 器 进行 经 验 风 险 最 
的 推荐 准确 性 。 文 献 [62] 则 是 根据 用 户 的 活动 水 平 对 不 同 用 小 化 ， 其 中 的 倾向 分 数 是 通过 数据 集 的 统计 指标 来 计算 的 。 
户 群 体 进行 分 析 ， 提 出 了 一 种 基于 启发 式 重 新 排序 的 公平 性 b 有 文献 通过 模型 来 计算 倾向 分 数 。 例 如 , 文献 [72] 提 出 一 个 
约束 方法 来 缓解 知识 图 上 的 不 公平 问题 ， 除 了 群体 不 公平 度 组合 联合 学 习 , 同时 学 习 无 偏 的 用 户 -物品 相关 性 和 无 偏 的 倾 
量 ， 还 提出 了 个 体 不 公平 度量 ， 只 需 蔡 换 约束 条 件 即 可 。 文 名 性 ， 用 数据 集 的 不 同 部 分 去 学 习 这 两 个 子 模型 ， 以 防 数据 
献 [63] 也 是 从 用 户 角度 出 发 解决 弱势 群体 的 问题 ， 提 出 了 一 ”重复 使 用 带 来 的 偏差 问题 ， 其 中 的 倾向 分 数 的 计算 就 是 通过 
种 重新 排序 的 方法 ， 在 评估 指标 上 添加 约束 ， 生 成 公平 感知 ”模型 从 数据 中 学 习 出 来 的 ， 而 文献 [73] 为 了 提高 倾向 得 分 估 
的 推荐 列表 ， 从 而 缓解 了 不 公平 问题 ， 具 体 来 说 ， 将 原始 推 ” 计 的 准确 性 ， 使 用 了 小 型 的 注释 数据 集 来 推 煌 可 重复 使 用 的 
荐 算法 输出 的 TOP-N 列表 为 重新 排序 算法 的 输入 , 重新 排序 ”倾向 模型 的 参数 ， 文 献 [74] 则 是 提出 了 一 种 配对 倾向 得 分 估 
算法 的 目标 函数 是 最 大 化 公平 约束 下 的 预测 评分 总 和 ， 最 后 。 计 方 法 ， 通 过 计算 用 户 流行 度 和 无 偏 流行 度 的 配对 程度 更 精 


tah H 


输出 TOP-K 列表 , 最 终 再 对 TOP-K 列表 中 的 物品 进行 排序 ， 确 的 绥 解 了 曝光 偏差 。 相 关 学 者 通过 倾向 估计 来 缓解 位 置 偏 
作为 最 终 的 推荐 列表 。 差 57579I 和 上 下 文 偏差 9 中。 为 了 降低 对 用 户 搜索 体验 的 侵入 
2.5 基于 相关 性 去 偏 总 结 性 干扰 ， 文 献 [65] 提 出 了 一 种 从 反馈 日 志 中 获取 干预 数据 的 

均匀 数据 是 通过 随机 推荐 策略 实施 推荐 来 收集 的 无 偏 数 方法， 在 无 干预 的 情况 下 进行 位 置 偏差 的 估计 。 也 有 相关 学 


据 ， 数 据 本 身 就 是 不 存在 偏差 的 ， 但 缺点 在 于 这 种 数据 的 收 者 致力 于 改进 IPS 方差 较 大 的 缺点 来 缓解 选择 偏差 。 文 献 [8] 
集 和 处 理 有 可 能 会 损害 用 户 体验 ， 成 本 较 高 。 采 样 方式 是 通 AAA T Data imputation 模型 和 IPS 模型 ， 构 建 了 无 偏 估计 
过 合理 的 采样 策略 来 控制 哪些 数据 用 来 训练 模型 ， 采 样 策略 。 器 ， 只 要 两 种 模型 中 有 一 种 模型 正确 ， 便 可 保证 算法 的 无 偏 
的 选 定 较 为 关键 。 样 本 加 权 则 是 在 训练 过 程 中 给 不 同 的 样本 PE, 最 终 实现 了 双重 鲁 棒 性 。 文 献 [9,10] 也 提出 了 优 于 IPS 的 
赋 于 不 同 的 权重 来 缓解 偏差 , 正则 化 也 属于 训练 模型 的 一 种 ， 双重 鲁 棒 性 评估 器 ， 最 新 的 研究 中 文献 [11] 为 了 进一步 减少 
在 训练 模型 中 通过 正则 化 项 ， 来 影响 偏差 和 推荐 结果 之 间 的 方差 ， 提出 了 MRDR(More Robust Doubly Robust) 估 计量 。 
关联 程度 ， 从 而 缓解 偏差 问题 。 训 练 模型 则 是 利用 各 种 技术 上 述 利用 IPS 思想 的 相关 研究 很 好 的 解决 了 积极 反馈 的 
在 训练 模型 的 过 程 中 将 偏差 解决 。 评 估 器 是 通过 修正 评估 度 。 偏差 但 却 未 考虑 缺失 反馈 数据 的 偏差 ， 忽略 了 未 点 击 物品 
量 来 实现 无 偏 的 推荐 ， 依 赖 于 新 提出 的 衡量 偏差 指标 。 重 排 也 不 一 定 不 相关 的 问题 ， 所 以 有 相关 学 者 就 此 不 足 展开 研究 
序 是 一 种 可 以 应 用 于 任何 推荐 算法 的 后 处 理 步 又， 对 有 偏差 。 和 改进 ,文献 [77] 提 出 了 一 种 双重 的 推荐 学 习 框 架 , 所 提出 的 
存在 的 推荐 列表 通过 一 定 的 重 排 序 规则 ， 减 少 偏差 对 推荐 结 ” 损失 函数 采用 两 种 倾向 加 权 ， 以 更 有 效 的 估计 点 击 和 未 点 击 
果 的 影响 程度 。 数据 的 真实 偏好 ， 同 时 消除 了 点 击 和 未 点 击 数 据 的 偏差 。 文 
均匀 数据 和 采样 属于 前 处 理 方式 ， 致 力 于 在 将 数据 输入 ” 献 [78,79] 则 是 对 IPS 进行 改进 ， 提 出 了 一 种 新 的 加 权 方 案 


训练 模型 前 就 解决 偏差 问题 ， 而 样本 加 权 、 正 则 化 、 训 练 模 (Propensity Ratio Scoring), 来 考虑 缺失 反馈 偏差 问题 的 解决 。 
型 等 中 处 理 手 段 致力 于 在 训练 模型 过 程 中 解决 偏差 ， 评 估 器 本 文 对 基于 IPS 的 相关 文献 整理 汇总 如 表 2 所 示 。 其 中 
和 重 排序 等 后 处 理 操作 致力 于 在 训练 出 模型 之 后 再 对 推荐 结 ”使 用 数据 范围 是 指 文 献 中 推荐 算法 输入 的 数据 的 范围 ， 反 馈 
果 进 行 微 调 来 调控 偏差 问题 。 数据 是 指 用 户 和 物品 有 交互 记录 的 数据 ， 没 有 反馈 数据 并 不 

代表 用 户 对 物品 不 感 兴趣 。 填 充 数据 是 指 用 户 和 物品 没有 交 


3 ”基于 因果 性 去 仿 互 记录 的 数据 ， 但 论文 做 了 数据 填充 。 
相关 性 推荐 对 观测 数据 的 依赖 较 大 ,优势 在 于 思想 简单 ， 3.2 基于 因果 图 的 因果 性 去 偏 
只 需 不 断 的 拟 合 数据 ， 最 终 使 得 模型 能 较 好 的 匹配 数据 ， 但 寻 果 图 是 反 事实 推理 的 有 力 工具 。 从 观察 到 的 数据 中 解 
是 仅仅 基于 相关 性 无 法 很 好 的 评估 和 解决 偏差 问题 ， 这 是 因 决 因果 推断 间 题 有 两 种 框架 ， 分 别 是 潜在 结果 框架 (Potential 
为 相关 性 无 法 推理 出 输入 和 输出 之 间 的 因果 关系 ， 而 偏差 存 Outcome Framework) 和 结构 因果 模型 (Structural Causal 
在 的 原因 可 能 存在 于 用 户 和 系统 交互 某 一 个 阶段 中 的 因果 关 ”Model)。 结 构 因 果 模 型 包括 因果 图 和 结构 方程 式 ， 可 以 将 系 
系 中 。 因 此 ， 因 果 性 推荐 比较 适合 解决 偏差 问题 ， 更 有 利于 统 中 的 因果 描述 为 一 组 变量 和 变量 之 间 的 因果 关系 ， 其 中 变 
偏差 的 定位 和 解决 ， 更 有 利于 准确 的 消除 偏差 所 带 来 不 良 影 量 之 间 的 因果 关系 由 一 组 同时 成 立 的 结构 不 等 式 来 建 模 [ 鸣 。 
响 ， 也 有 利于 提升 推荐 算法 的 可 解释 性 。 羽 果 图 能 够 描述 推荐 系统 中 的 因果 关系 ， 模 拟 出 用 户 和 

因果 推断 是 基于 效果 发 生 的 条 件 来 得 出 关于 因果 关系 结 物品 交互 的 可 能 因素 ， 痢 析 有 具体 某 个 偏差 存在 的 位 置 ， 进 而 
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要 的 因果 关系 ， 将 用 户 与 物品 的 交互 归 因 于 用 户 和 物品 的 


[ei mh 


S imi 


配 度 、 物 品 流行 度 和 用 户 活跃 度 ， 在 训练 期 间 利 用 多 任务 


趣 和 一 致 性 偏差 


TH E RIA DSL ARE EN 5f 2 BUR RSEREU A BE SER 


的 数据 分 开 训 


消除 人 气 的 影响 , 最 终 缓解 了 人 和 气 偏差 。 但 文献 [82] 则 认为 
不 是 所 有 的 偏差 都 是 有 害 的 ， 不 能 盲目 的 消除 所 有 偏差 ， 提 


， 一 种 是 兴趣 
是 符合 性 嵌入 来 捕 


品 的 真实 兴趣 ， 
一 致 性 偏差 ， 然 
后 消除 了 一 致 性 
通过 数据 学 习 到 前 


值 ， 在 测试 期 间 执行 反 事实 推理 来 


HERF ARF tH 有 效 的 利用 人 气 偏差 来 提高 推荐 效果 ， 文 献 认为 人 气 偏差 


站 的 一 致 性 的 存在 是 因为 热门 的 物品 过 度 上 曝光 ， 并 通过 更 加 精细 化 的 因 


性 。 该 研究 所 基于 区 


捕捉 和 定位 也 比较 


文献 [81] 利 用 较为 六 


图 假定 了 反馈 数据 的 生成 过 程 ， 在 训练 阶段 消除 了 人 气 仿 


差 带 来 的 消极 影响 的 同时 也 利用 了 人 人气 偏差 的 积极 影响 ， 达 
到 了 利用 偏差 提高 推荐 效果 的 目的 。 也 有 学 者 利用 因果 图 解 
决 点 击 诱饵 问题 。 

果 性 偏差 研究 


Tab.2 Research on causal method bias based on IPS 


rr 
A ， 倾向 分 数 倾向 分 数 Q B 
ak 含义 计算 方式 g 
ya Fi] 
分 不 是 所 j 史 记录 中 某 个 
66] ”选择 偏差 UN. ZEE 。 反馈 
pu 评分 的 代表 性 样本 wamm OU BARA BE 
户 看 到 不 同位 “不 同位 置 的 物品 随机 交 
67] ”位 置 偏差 ”物品 位 置 影响 交互 D. 
a) mm A mE 
位 置 偏差 、 上 物品 位 置 和 周围 环境 两 种 偏差 倾向 分 基于 回归 的 期 望 最 大 化 和 修正 评 
68 决 于 检查 性 、 相 关 性 和 比较 D 
(5) 下文 偏差 影响 交互 E Mien 数 之 积 法 RR ae 
品 流行 度 影响 物品 “倾向 独立 于 用 户 ， 物 品 被 呈现 的 概率 由 流行 度 决 历史 记录 中 某 个 反馈、 
69] AARE 利用 物品 流行 度 函 妆 
Ber ae 被 推荐 概率 定 的 ， 交 互 概率 与 物品 被 推荐 的 概率 无 关 “互动 出 现 的 概率 。 利用 物品 流行 度 画 数 。 填充 


[70] ”曝光 偏差 


[72] ”曝光 偏差 


为 品 曝光 影响 交互 


为 品 曝光 影响 交互 


相对 点 击 概率 的 b 次 曙 反馈、 
(b 为 超 参数 ) 填充 


papka A 


曝光 概率 


文献 [19] 人 首先 想象 一 个 反 事 实 世 界 ， 在 反 事 实 世 界 旦 ! 物品 特征 
每 个 物品 只 有 了 曝光 特征 ， 通 过 估计 反 事实 世界 中 | Y : 交互 概率 
可 能 性 ， 能 够 降低 曝光 特征 对 预测 评分 的 直接 影响 ， 从 而 消 A 
除 点 击 诱饵 问题 。 文 献 [83] 建 模 用 户 表 示 对 预测 得 分 的 因 E 
效应 ， 认 为 循环 的 主要 原因 是 用 户 表示 和 u: SOURCE o 
在 物品 的 分 布 不 ] 户 表示 在 物品 上 的 分 布 是 一 个 存在 i f Bondi 
于 用 户 表 示 和 预测 分 数 之 间 的 混淆 因子 ， 造 成 了 两 LE 一 :交角 [8 中 的 因果 图 
虚假 相关 性 ， 去 除 混淆 因子 的 影响 后 便 可 纠正 循 Hi eee 
EFA RANE 里 如 表 3 和 图 6 所 示 ， D: 人 气 偏差 
是 指 每 篇 文献 在 因果 图 中 对 特定 偏差 的 定位 。 2 ARNA THR 
@: 循环 偏差 


从 图 6 可 以 看 


果 关 系 构成 ， 


和 用 户 特 征 决定 。 文 献 [81] 由 


出 ， 推 荐 系统 中 最 简化 的 
分 别 是 物品 特征 (D 一 交互 概率 (Y) 和 用 
U> 交互 概率 (Y), 代表 用 户 和 物品 的 交互 概率 由 4 


羽 果 关系 中 更 细 化 站 特征 和 和 物品 特征 的 匹配 度 (K)。 
文献 [82] 也 更 加 细 化 了 物品 特征 (一 交互 概率 (Y) 的 


BR, 认为 物品 的 人 气 (Z) 是 其 中 的 一 个 混 涌 


上 从 物品 特 生 3.3 ”其 他 因果 性 去 偏方 法 


E(D- 交互 概率 (Y) 


图 6 文献 [19,81~83] 整 合 后 的 因果 图 
Fig.6 Causal graph after integration in literature[19,81~83 


除了 IPS 和 因果 图 这 两 种 因果 技术 ， 也 有 其 他 研究 学 者 


将 因果 性 方法 融合 一 些 深度 学 习 技 术 来 实现 


REK X 


K 
献 [84] 指 出 用 户 对 公平 的 需求 是 个 性 化 的 ， 提 出 从 用 户 特 征 


人 气 偏差 提升 了 推荐 效果 。 文献 [19] 在 物品 特 条 


率 (Y) 的 因果 效 


Ph 加 入 物品 暴露 特 纪 


E(E) 和 内 容 特 征 (T)， 分 


别 代 表 物 品 在 月 
击 之 后 看 到 的 物品 内 部 特征 ， 定 位 到 了 点 击 i 
| 实现 了 对 用 户 特征 (U) 一 
训练 数据 在 物品 不 同类 别 中 的 分 布 (D) 
E(M)， 定 位 了 


原因 ， 文 献 [83 
效应 的 精细 化 ， 
和 组 级 别 的 用 广 


前 物品 暴露 给 月 


FP 剔除 敏感 特征 ， 来 实现 个 性 化 的 反 事 实 公 平 ， 通 过 对 抗 学 
习 生 成 特征 独立 的 用 户 嵌 入 进行 推荐 ， 同 时 算法 也 覆盖 非 个 
性 化 的 情况 。 该 研究 同时 训练 预测 器 和 对 抗 分 类 器 ， 前 者 学 


交互 概率 (Y) 因 果 


循环 1 


AI AK 


各 种 偏差 的 思路 , 将 各 种 用 户 产生 偏差 均 定 


一 交互 概率 (Y) 因 果 关系 中 ， 不 断 细 化 梳理 


完 提 供 了 一 种 关于 


对 果 过 程 ， 最 后 统一 训练 用 户 无 偏 
户 产生 的 各 种 偏 


WRF A 


习 推 荐 任务 的 信息 表示 ， 后 者 从 学 到 的 信息 表示 中 预测 受 保 
护 特 征 ， 将 敏感 特征 从 学 习 到 的 表示 中 移 除 ， 确 保 了 算法 的 
公平 性 。 另 外 , 文献 [85] 为 了 解决 选择 偏差 和 位 置 偏差 提出 了 
一 种 新 的 反 事 实 方法 , 采用 了 Heckman 两 阶段 法 ,并 考虑 了 
系统 中 的 选择 和 位 置 偏差 ， 在 偏差 不 大 的 情况 下 ， 对 噪声 具 
有 更 强 的 鲁 棒 性 和 更 好 的 精度 。 
3.4 基于 因果 性 去 偏 总 结 


基于 IPS 的 偏差 解决 方案 主要 通过 估计 倾向 分 数 和 用 倾 


向 分 数 的 倒数 重新 加 权 样 本 融合 到 推荐 模型 中 来 缓解 偏差 。 


202205.00139v1 
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而 基于 因果 图 的 偏差 解决 方案 则 是 通过 因果 图 来 描述 推荐 系 分 数 的 计算 可 以 通过 简单 的 自 定义 函数 ， 也 可 以 通过 预先 的 
统 中 的 因果 关系 ， 模 拟 出 用 户 和 物品 交互 的 可 能 因素 ， 章 析 实验 来 确定 ， 也 可 以 在 训练 数据 的 过 程 中 来 学 习 。 基 于 因果 
体 某 个 偏差 存在 与 某 条 因果 关系 中 ， 进 而 利用 各 种 手段 去 图 的 难点 在 于 如 何 正确 的 拟定 推荐 系统 中 的 因果 关系 ， 只 有 
除 偏差 的 影响 。 基 于 IPS 的 偏差 解决 方案 依赖 于 倾向 分 数 的 拟定 的 因果 关系 符合 整个 推荐 过 程 的 因果 关系 ， 才 会 缓解 偏 


计算 ， 倾 向 分 数 的 不 准确 可 能 导致 该 方法 的 方差 较 大 。 倾 向 


差 ， 进 而 提升 推荐 效果 。 


表 3 


基于 因果 图 的 因果 性 偏差 研究 


Tab.3 Research on causality method bias based on causal graph 


定 使 用 数据 改进 

pen 原因 és ee 
文献 偏差 原 位 假设 实现 方式 范围 阶段 

点 击 诱 ”物品 暴露 特征 影响 交互 概率 取决 于 用 户 特征 、 物 品 特征 和 物 要 
19 E-Y 事实 推理 去 除 曝光 特征 的 直接 影响 
ae 25 esp uu 反 里 去 除 曝 光 特 征 的 直接 影响 

一 致 性 点 击 概率 取决 于 兴趣 和 
80 r1 p RA] A 4 学 习 兴 Fi 寺 征 0 A EX 
[ mm 物品 人 气 值 影响 交互 从 众 心理 分 开学 习 兴 趣 特征 和 偏差 特 和 

人 气 偏 交互 概率 取决 于 用 户 -物品 匹配 度 、 物 品 流 训练 模 
81 品 属性 影响 交互 ”IY 事实 推理 去 除 物品 内 在 属性 的 影响 WT 
[ " 物品 属性 影响 交 行 度 和 用 户 活跃 度 反 事 实 推理 去 除 物品 内 在 属性 的 影响 as " 
[82 人 气 偏 物品 人 气 值 影响 曝光 概 yd 交互 概率 取决 于 用 户 特 征 、 物 品 特征 和 物 VIS ART RO GAO DEREN], HEIN EUN Tf 

x x 品 的 人 气 值 行 度 对 交互 的 积极 影响 

循环 偏 历史 记录 分 布 不 均匀 影 D- 交互 概率 取决 于 等 征 、 物 品 特征 和 组 
83 天 果 建 模 去 除 混 消 因 子 的 影响 
ae 响 用 户 特征 。 级 别 的 用 户 特征 人 


3.5 ”基于 相关 性 去 偏 和 基于 因果 性 去 偏 的 对 比分 析 
局 致 力 于 通过 不 断 的 拟 合 数据 来 挖掘 相关 模 


相关 性 去 1 


式 去 实现 无 偏 的 推荐 。 思 路 较为 简 自 
域 的 因果 先 验 知识 ， 只 需 拟 合 数据 ， 


荐 效果 即 可 。1 


据 中 挖掘 到 的 相关 关系 不 一 
好 的 模型 ， 在 与 训练 数据 分 布 状 况 不 同 的 数据 中 
时 ,效果 会 较 差 。 虚 人 
所 以 就 算是 在 训练 数 扩 


是 由 于 虚假 相关 性 的 存在 ， 模 型 


段 相关 性 也 会 导 


明和 测试 数据 分 布 状况 相同 


定 总 是 成 立 ， 所 以 会 


进而 纠正 仿 


致 不 正确 的 推 


RB. AN iia EET Lm S 


de 4 相关 性 去 偏方 法 和 因果 性 去 偏方 法 对 比 


Tab.4 Comparison of correlation debias method and 


causality debias method 


相关 性 去 偏 也 不 一 定 总 是 可 靠 ， 


和 不 可 干预 的 。 对 相关 性 去 全 


对 比如 表 4 所 示 。 


方法 与 因果 性 


TE, 因此 推荐 规则 更 加 可 


关系 也 导致 推荐 规 贝 
果 干 预 技术 获得 更 优质 的 


统 中 的 因果 关系 实施 
性 , 模型 的 推荐 效果 泛 化 能 力 较 好 。 提前 拟定 的 因 


3E. A 


1 具有 一 定 的 可 解释 性 , 而 


E 荐 结果 。 ALR 


ETE, 不 过 分 依赖 于 1 


而 且 推 荐 规则 是 不 可 解释 


因果 性 去 偏 能 够 去 掉 相关 性 去 偏方 法 中 的 强 虚 假 相关 
果 性 去 偏 中 提 


类 提升 推 。 nk 优势 局 限 
在 训练 数 "T 推荐 规则 不 可 靠 、 不 可 解释 、 不 
PA 相关 性 e 可 干预 
导 i 2 i 二 1 i. 4 SS . 
wann a CAARASSATPS— 可 能 会 存在 强 的 虚假 相关 性 ， 影 
BEAT TE f 拟 合 数据 效果 好 — 
荐 结果 ， ees 
的 情况 下 ， — 因果 性 推荐 规则 可 靠 、 可 解 pea de 
AR 释 、 可 干预; AN BETA H i " 
去 偏 汉化 能 力 较 好 o 因果 关系 抽取 不 全 面 不 准确 可 能 
去 偏方 法 整理 会 影响 推荐 效果 
4 数据 集 和 评价 指标 
前 拟定 的 因果 推荐 模型 的 推荐 效果 要 想 获得 公认 、 客 观 的 评价 ， 统 一 
且 可 以 利用 因 的 数据 集 和 评价 标准 是 必 不 可 少 的 。 偏 差 问题 客观 存在 于 各 
去 偏 利用 推荐 系 ”种 推荐 场景 中 ,偏差 研究 目的 是 修正 偏差 , 进一步 提升 推荐 
| 练 数据 中 的 相关 效果 , 因此 偏差 相关 的 研究 所 选用 的 数据 集 和 推荐 系统 常用 
果 关 系 虽 数据 集 无 异 。 


然 能 够 带 来 一 定 的 解释 性 , 但 如 果 提 前 拟定 的 因果 关系 不 符 本 章 主要 总 结 前 述 偏差 研究 中 所 使 用 的 公开 数据 集 和 
合 现 实 世 界 中 实际 的 因果 关系 或 者 不 全 面 不 准确 ， 推 荐 效果 ”评价 指标 , 对 当前 学 者 所 选用 的 数据 集 以 及 所 研究 的 偏差 种 
会 较 差 。 类 进行 汇总 ， 如 表 5 所 示 。 
K5 ”常用 数据 集 以 及 目前 数据 集 上 的 偏差 研究 概况 
Tab.5 Common dataset of bias and an overview of bias studies 
数据 集 户 数 “物品 数 ” 评分 数 ”稠密 性 ii 数据 集 上 已 实验 验证 的 偏差 种 类 (文献 数量 /篇 ) 
MovieLens 100K 943 1682 100000 6.30% [1,5] 
MovieLens IM 6040 3952 1000209 4.19% [1,5] 
MovieLens 10M 71567 10681 10000054 1.3196 [0.5,5] 人 气 偏 差 (8)、 不 公平 (3)、 选 择 偏差 (4)、 曝 光 偏 差 (1)、 循 环 偏差 (1D)、 一 致 性 偏差 (1) 
MovieLens 20M 138493 27278 20000263 0.53% [0.5,5] 
MovieLens25M 162541 62423 25000095 0.25% [0.5,5] 
Netflix 480189 17770 100480507 1.18% [1,5] 一 致 性 偏差 (1) 
Last.fm 1892 17632 92834 0.28% 人 气 偏差 (2)、 曝 光 偏 差 (1)、 不 公平 (1) 
Epinions 49290 139738 664824 0.01% [1,5] 人 气 偏差 (2)、 选 择 偏差 (1) 
Amazon 5786 26573 14280000 0.002% [1,5] 人 气 偏差 (2)、 曝 光 偏 差 (1)、 循 环 偏差 (1)、 不 公平 (2) 
Adressa 16G 3083438 48486 27223576 0.012% 人 气 偏差 (1)、 点 击 诱 乌 (1)、 不 公平 (1) 
Yelp 2189457 1162119 8635403 0.043% [1,5] 人 气 偏差 (1)、 曝 光 偏差 (1) 
Yahoo ! R3 15400 1000 311704 2.02% [1,5] 选择 偏差 (6)、 曝 光 偏差 (3)、 循 环 偏差 (2)、 位 置 偏差 (1)、 上 下 文 偏差 (1) 
Coat 290 300 6960 8.00% — [1,5] 选择 偏差 (7)、 曝 光 偏差 (1)、 循 环 偏差 (1) 
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4.1 常用 数据 集 4.2.1 传统 性 能 评价 指标 
MovieLens 包含 多 个 用 户 对 多 部 电影 的 评级 数据 和 电影 评分 预测 指标 。 评 分 预测 的 准确 度 一 般 根据 均 方 根 误差 
元 数据 信息 。 众 多 研究 在 MovieLens 数据 集 上 进行 去 偏 实验 ， ”(RMSE)、 平 均 绝 对 误差 (MAE) 和 均 方 误差 (MSE) 计 算 。 去 除 
缓解 了 其 中 的 人 气 偏 差 BL3343.445057801、 不 公平 [5525461841、 偏差 的 效果 越 好 ， 评 分 预测 指标 就 会 越 小 ， 推 荐 效果 越 好 。 
选择 偏差 0%53%6"、 了 曝光 偏 差 中 、 一 致 性 偏差 9 和 循环 偏差 集合 推荐 指标 。 由 于 数据 稀疏 性 和 冷 启 动 问题 的 存在 ， 
[83]。 相 关 的 电影 数据 集 还 有 Netflix， 文 献 [80] 使 用 该 数据 集 有 时 直接 预测 用 户 对 物品 的 评分 是 困难 的 ， TOP-N 推荐 方法 
进行 实验 缓解 了 一 致 性 偏差 。 被 广泛 使 用 ， 不 再 预测 用 户 对 物品 的 评分 ， 而 是 生成 一 组 用 
Last.fm 是 一 个 在 线 音乐 数据 集 , 包含 用 户 的 收听 记录 以 户 最 有 可 能 喜欢 的 物品 集合 推荐 给 用 户 。 去 除 偏差 的 效果 越 
及 匿名 用 户 的 社交 网 络 情况 。 有 研究 缓解 了 其 中 的 人 气 偏差 好 ， 集 合 推荐 指标 就 会 越 大 。 TOP-N 推荐 中 广泛 使 用 的 推荐 
B1334、 了 曝光 偏差 C1 和 不 公平 问题 [1 。 效果 指标 包括 准确 率 、 召 回 率 、F1 指标 等 。 
Epinions 数据 集 被 广泛 应 用 在 商品 推荐 领域 ， 有 相关 研 排名 推荐 指标 。 当 推荐 物品 的 数量 很 大 时 ， 用 户 会 更 重 
究 缓解 了 该 数据 集中 的 人 气 偏差 63404 和 选择 偏差 [1 。 视 推 荐 列表 中 排 在 前 面 的 物品 ， 去 除 偏差 的 效果 越 好 ， 排 名 
Adressa 数据 集 包 含 了 用 户 对 文章 的 评分 记录 。 有 相关 看 推荐 指标 就 会 越 大 。 常 用 的 排名 度量 指标 包括 归 一 化 折扣 累 
究 缓 解 了 该 数据 集中 的 人 气 偏差 BU、 点 击 诱饵 N99 和 不 公平 问 计 收 益 和 平均 准确 率 。 
FEU), Yelp 数据 集 是 美国 最 大 的 点 评 网 站 内 部 整理 得 到 的 数 推荐 领域 数据 集 众 多 ， 且 评价 指标 多 样 ， 本 文 对 所 涉及 
据 集 。 文献 [41] 和 文献 [81] 分 别 缓解 了 该 数据 集中 的 曝光 偏差 参考 文献 的 实验 效果 进行 了 汇总 对 比 。 由 于 包含 来 自 随机 实 
和 人 气 偏差 。 验 的 无 偏 数据 ，Coat 和 Yahoo!R3 数据 集 在 推荐 系统 中 的 偏 
Yahoo! R3 是 音乐 服务 推荐 中 的 一 个 数据 集 ， 其 中 测试 差 领域 被 广泛 使 用 ， 因 此 本 文 整理 出 Coat 和 Yahoo!R3 上 的 
集 通过 要 求 用 户 对 随机 选择 的 歌曲 进行 评分 来 收集 。 当 前 众 部 分 实验 数据 ， 如 表 6 和 表 7 所 示 ， 希望 为 后 续 研 究 提 供 一 
n AT FB Y XOU HE A BS e PE fd 268 510. 11,59.47.38,791.— (08 Xi fg 定 的 指导 性 ， 从 表 中 可 以 看 出 ， 因 果 性 去 偏方 法 在 评分 预测 
en 差 B844、 位 置 偏差 中、 曝光 偏差 "和 上 下 文 偏差 9。Coat 指标 上 较 有 优势 但 优势 不 明显 ， 而 在 集合 推荐 指标 上 的 效果 
co 数据 集 包含 机 械 工 人 对 外 套 的 评分 。 其 中 测试 集 是 通过 要 求 对 比 显示 ， 相 关 性 的 解决 方案 指标 效果 较 好 ， 也 间接 证 明了 
= 工人 对 随机 选择 的 外 套 进行 评分 而 收集 。 众 多 研究 缓解 了 该 基于 相关 性 的 偏差 解决 方案 拟 合 数 据 效 果 更 好 ， 而 基于 因果 
e BBE SE HE E 2 Bf 26 10. 1139.4758771. GR fig Fe A). 性 的 偏差 解决 方案 只 能 拟 合 一 部 分 数据 。 
CO 42 性 能 评价 指标 X6 评分 预测 指标 效果 对 比 
LO 推荐 算法 的 评估 指标 根据 推荐 任务 的 不 同 可 分 为 评分 预 Tab. 6 Comparison of the performance of scoring predictive metrics 
e 测 指标 、 集 合 推荐 指标 、 排 名 推荐 指标 以 及 偏差 衡量 指标 ， 文献 去 偏 Coat Yahoo!R3 
CN 其 中 前 三 类 评价 指标 都 属于 传统 性 能 评价 指标 。 在 不 考虑 偏 ”方法 RMSE MAE MSE RMSE MAE MSE 
N FALMER BE, PORER, REAREA BE [8] ”因果 0.756 — 0.967 0.736 — 0.957 
= 排名 推荐 指标 升 高 ， 能 直接 代表 推荐 效果 的 提升 。 在 考虑 偏 [39] ”相关 0.759 0.973 0.774 0.977 
nu 差 的 研究 中 ， 除 了 评分 预测 指标 降低 、 集 合 推荐 指标 和 排名 [47] 相关 0857 0670 - 1.165 071  - 
2 E 荐 指标 升 高 ， 还 有 偏差 衡量 效果 指标 的 变化 ， 可 以 代表 去 [55] ”相关 0.878 1.129 0.999 1.518 
>< 偏 效 果 的 提升 ， 进 而 提升 推荐 效果 。 [58] ”相关 0.831 1.105 0.765 1.014 
© 
a 表 7 集合 推荐 指标 效果 对 比 
© Tab. 7 Comparison of the performance of collection recommendation metrics 
Oo Yahoo! R3 Coat 
文献 AzA Recall@5 NDCG@5 Lus Recall@5 NDCG@5 "ee 
@3 @3 
[40] 相关 0.645 0.522 
[72] KE -- -- 0.6694 - - 0.6741 
[77] 因果 0.3388 0.2785 0.2068 0.3952 0.3984 0.2354 
[79] Da 0.6206 
4.2.2 偏差 衡量 指标 推荐 的 次 数 。 所 以 经 常 考虑 基尼 指数 来 以 确保 建议 在 所 有 物 
目前 推荐 系统 中 的 偏差 研究 还 不 够 完善 和 全 面 ， 因 此 ， rp AE A HB e 
暂时 还 没有 较为 统一 和 权威 的 偏差 衡量 指标 。 因 此 本 文 对 前 Tai 
述 相关 文献 中 所 提出 的 偏差 衡量 指标 进行 汇总 ， 和 希望 为 后 续 Lya (1) 
的 推荐 系统 偏差 研究 提供 参考 。 IU Ml 
ARP(Average Recommendation Popularity) 指 标 用 来 计算 Agg -Div=! (2) 
每 个 列表 中 推荐 物品 的 平均 受 欢 迎 程度 ， 对 于 推荐 列表 中 的 |z] 
任何 给 定 建 议 物品 ， 它 测量 这 些 物品 的 平均 评分 数 ， 如 式 (1) 基尼 指数 用 来 测量 推荐 物品 频率 分 布 的 不 均匀 性 。 如 果 
所 示 , 其 中 exo 表示 培训 集中 物品 ;的 评级 次 数 。 但 是 ARP TR 经 常 推 荐 某 些 物品 而 忽略 其 他 物品 ， 基 尼 指 数 将 很 高 。 如 式 
标 会 因为 算法 向 每 个 人 推荐 一 些 非常 不 受 欢 迎 的 物品 而 取 值 (3) 所 示 。 其 中 ， pli! L) nas 
较 低 ， 为 了 弥补 这 一 缺点 ， 出 现 了 另 个 指 Gini(Z) =1- o | Dp (él L) Q) 
户 中 独特 推荐 物品 的 比率 ， 用 来 度量 一 个 算法 在 多 大 程度 上 [ZT 
增加 了 唯一 推荐 物品 的 数量 , 如 式 (2) 所 示 , 此 指标 的 值 越 高 ， 文献 [50] 为 量化 人 气 偏差， 选择 使 用 基尼 系数 来 衡量 
说 明 推荐 列表 涵盖 的 物品 类 别 越 多 ， 但 是 此 指标 不 区 分 物品 与 物品 受 欢 迎 程度 相对 应 的 真 阳 性 率 的 平等 性 , c E LT 
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录用 定稿 a8 dé, 3 
点 击 量 为 G ,如 式 (4)(5) 所 示 。 其中，4 表示 喜欢 物品 ;的 匹配 
用 户 总 数 ， 物 品 索 引 从 1 到 M，Gini 的 取 值 范围 [-1,1]， 取 值 


越 小 代表 人 气 偏差 越 小 。 


TPR = (4) 
> (2i-M -DIPR, 
Gini = = (5) 


MX TPR, 
iel 


文献 [54] 使 用 了 人 和 气 率 (Popularity Rate) 作 为 一 种 公平 性 


面向 偏差 问题 的 


各 个 研究 的 主要 不 同 之 处 在 于 倾向 分 数 的 计算 以 及 其 
该 方法 的 效果 好 # 
的 准确 性 ， 倾 向 分 数 的 不 ; 
X Bm rA SE. CRI 
算 ， 有 的 进行 一 
的 模型 从 数据 中 来 学 习 


的 假设 。 
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很 大 程度 上 


依赖 于 倾向 分 数 计算 


下 预先 


方差 大 的 缺点 


(4) 基 于 因果 图 的 因果 性 


究 使 
的 实验 来 提前 确定 ， 
项 向 分 数 。 


确 性 会 导致 该 方法 的 方差 较 大 。 
用 单纯 自 定义 的 函数 来 计 
岂 有 的 通过 无 偏 
如 何 更 加 准确 的 计算 倾向 
将 是 未 来 主要 的 看 


去 1 


前 主要 思想 就 是 理 清 推 


统 中 的 因果 关系 ， 定 位 到 偏差 的 位 置 ， 


然后 利用 反 事实 


度量 方式 。 它 是 指 推荐 列表 中 受 欢迎 的 物品 相对 于 列表 中 的 来 去 掉 偏差 带 来 的 消极 影响 ,难点 是 如 何 确定 各 种 因果 关系 ， 
物品 总 数 的 比值 ， 也 可 以 看 做 受 欢迎 程度 的 公平 性 度量 。 度 只 有 拟定 的 因果 关系 符合 整个 推荐 过 程 的 因果 关系 ， 最 终 才 
量 值 越 小 , 系统 越 公平 。 文 献 [54] 也 使 用 基尼 指数 来 量化 个 体 会 带 来 推荐 效果 的 提升 。 未 来 的 研究 方向 应 是 利用 更 准确 旨 
推荐 质量 的 不 公平 程度 ， 给 出 所 有 物品 的 印象 列表 致 的 因果 图 ， 能 够 更 全 面 理 清 推荐 过 程 的 因果 关系 ， 发 现 更 
M=[g1,82,…,8m]， 基 尼 指 数 公 式 如 公式 (6) 下 。 其 中 ，3 表示 印 细 粒 度 的 因果 关系 ， 去 掉 由 混淆 因子 带 来 的 虚假 相关 性 ， 保 
"— 留用 户 作 出 某 种 反馈 行为 的 因果 关系 ， 进 而 准确 捕捉 隐藏 于 
混淆 反馈 数据 中 的 真实 用 户 偏好 ， 更 好 的 提升 推荐 效果 
Gini ANG) = Sraz D 2337 一 8j| (0) (5) 由 于 同 推荐 场景 中 会 同时 存在 多 种 偏差 ， 只 解决 某 
文献 [52] 提 出 了 一 个 指标 平均 贴现 收益 (MDG，Mean ”一 种 偏差 并 不 能 保证 推荐 算法 的 无 偏 性 ， 最 大 程度 的 提升 推 
Discounted Gain) 来 衡量 公平 性 ， 公 式 如 下 式 (7) 所 示 。 其 中 ， 荐 效果 , 如何 去 除 多 种 偏差 也 是 或 待 解决 的 一 个 问题 .另外 ， 
U: 是 新 物品 i 在 测试 集中 的 匹配 用 户 集 ， 纪 ;是 物品 i 在 用 户 w ”传统 的 指标 不 足以 衡量 推荐 问题 的 偏差 程度 ， 而 目前 尚未 有 
E 荐 列表 中 的 排序 位 置 。 MDG, =0 意味 着 物品 i 在 测试 期 间 统一 的 偏差 衡量 指标 ， 更 合理 有 效 和 统一 的 偏差 衡量 指标 的 
没有 推荐 给 喜欢 它 的 用 户 ，MDG =1 意味 着 在 测试 过 程 中 , 物 出 现 能 规范 推荐 算法 偏差 的 相关 研究 。 另 外 ， 像 Yahoo! R3 
品 ;i 对 所 有 匹配 用 Md 和 Coat 包含 无 偏 数据 的 数据 集 的 搜集 和 发 布 , 也 会 极 大 的 促 
wee! ó(2,; Sk) (7) 进 推 荐 系统 偏差 方面 研究 的 进展 。 
ae # log (1+ 4.) i 
TERES E: 6 ”结束 语 
文献 [57] 使 用 惊喜 度 指标 ， 该 指标 反映 了 在 推荐 列表 中 
为 用 户 找 到 物品 的 意外 程度 ， 它 是 通过 计算 在 为 用 户 u 准 备 由 于 推荐 系统 解决 “信息 过 载 ” 问 题 的 有 效 性 ， 推 荐 系 
的 推荐 列表 五 的 p 位 置 上 找到 物品 ;的 可 能 性 相对 于 随机 用 户 统 在 各 个 领域 的 应 用 广泛 且 普 遍 ， 其 中 不 可 忽略 的 偏差 问题 
找到 该 物品 的 可 能 性 ， 公 式 如 式 (8-10) 所 示 ， 例 如 , 仅 基 于 人 也 引起 了 广大 学 者 和 业界 的 关注 和 研究 。 偏 差 的 存在 影响 了 
气 的 非 个 性 化 推荐 策略 的 得 分 为 0， 如 果 只 推荐 不 同 的 和 用 推荐 效果 ， 如 何 妥 善 缓解 和 处 理 偏差 问题 就 显得 十 分 重要 。 
户 不 相关 的 物品 ， 包 括 长 尾 物品 ， 得 分 也 是 0。 羽 果 技术 能 够 发 现 整个 推荐 过 程 中 的 因果 关系 ， 有 利于 准确 
, 1[< 清晰 了 解 整个 推荐 过 程 的 因果 关系 。 同 时 也 提供 了 一 定 的 可 
serendipiy, @ k= 1] Ý max (Pry) Pros 000). (8) 解释 性 。 为 了 更 好 的 理解 推荐 系统 中 的 各 种 偏差 ， 本 文 首先 
Pra) - Ens 0) 根据 不 同 的 产生 主体 对 偏差 进行 分 类 ， 从 主体 角度 划分 偏差 
k-1 的 类 别 ， 有 利于 统一 去 除 同 个 主体 产 生 的 各 种 偏差 ， 为 一 
Paw) 次 性 去 除 多 种 偏差 提供 思路 。 其 次 本 文 重点 从 相关 性 和 因果 
BO (10) ”性 的 角度 分 析 和 对 比 了 推荐 系统 中 有 关 解 决 偏差 的 各 个 研究 ， 
希望 能 促进 使 用 因果 手段 解决 推荐 系统 偏差 的 研究 ， 接 下 来 
= HS 本 文 总 结 和 分 析 了 当前 推荐 系统 偏差 研究 普遍 使 用 的 数据 集 
5 。 研究 趋势 分 析 和 展望 h 性 能 评价 指标 以 及 新 提出 的 偏差 衔 量 指标 ， 希 望 为 偏差 衡 
本 文 将 推荐 系统 中 的 偏差 研究 分 为 相关 性 缓解 偏差 和 攻 量 指标 的 研究 提供 思路 ， 最 后 对 推荐 系统 中 的 偏差 研究 今后 
果 性 缓解 偏差 , 按 不 同 的 类 别 分 别 对 相关 研究 进行 分 析 和 展望 。 的 发 展 方向 进行 探讨 和 展望 。 
CD 前 处 理 的 技术 手段 主要 有 均匀 数据 和 采样 ,数据 的 收 " 
z WA eere eae. bademe PENR: 
集 和 处 理 有 可 能 会 损害 用 户 体验 ， 成 本 较 高 ， 所 以 很 多 研究 
致力 于 更 子 的 利 均匀 数据 或 者 结合 其 他 技术 手 段 来 达到 组 [1] Chen Jiawei, Dong Hande, Wang Xian, et al. Bias and debias in 
解 偏差 的 目的 ， 如 何 更 好 的 利用 均匀 数据 以 及 更 优质 的 采样 recommender system: A survey and future directions [EB/OL]. (2010) 
策略 是 接 下 来 的 研究 可 以 关注 的 问题 。 而 后 处 理 是 在 模型 输 [2022-02-10]. https://arxiv. org/pdf/2010. 03240. pdf. 
出 结果 之 后 进行 调整 来 缓解 偏差 问题 ， 方 法 较为 简单 ， 成 本 [2] Marlin B, Zemel R S, Roweis S, et al. Collaborative filtering and the 
低 且 有 具有 一 定 的 可 解释 性 ， 后 续 研 究 可 以 定义 更 优质 的 评估 missing at random assumption [EB/OL]. (2012) [2022-02-10]. 
器 和 重 排序 策 多 来 缓解 推荐 系统 中 的 偏差 问题 。 https://arxiv. org/pdf/12. 06. 5267. pdf. 
(2) 中 处 理 主 要 是 通过 些 训练 模型 或 者 手段 来 纠正 偏 [3] Yuan Bowen, Liu Yaxu, Hsia J Y, et al. Unbiased Ad click prediction for 
差 ， 相 较 于 前 处 理 和 后 处 理 ， 可 解释 性 会 较 差 ， 且 相 较 于 前 position-aware advertising systems [C]// Fourteenth ACM Conference on 
处 理 和 后 处 理 ， 中 处 理 训练 的 模型 会 更 依赖 于 训练 数据 ， 模 Recommender Systems. New York: ACM Press, 2020: 368-377. 
型 的 可 移植 性 不 高 。 构 建 更 优质 的 模型 、 提 高 模型 的 可 解释 [4] Joachims T, Granka L, Pan B, et al. Accurately interpreting clickthrough 
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